利用基于文本的节点属性的节点分类具有许多真实的应用程序,从学术引用图中的纸张主题到社交媒体网络中用户特征的分类范围。最新的节点分类框架(例如Giant)使用两阶段管道:首先嵌入图节点的文本属性,然后将所得嵌入的嵌入到节点分类模型中。在本文中,我们消除了这两个阶段,而是开发了建立在巨人基于端到端巨型(E2EG)的端到端节点分类模型。在我们的方法中,主体和辅助分类目标的串联利用导致了更强大的模型,从而使BERT主链可以切换为蒸馏编码器,其参数数量减少了25%-40%。此外,模型的端到端性质提高了易用性,因为它避免了链接多个模型进行节点分类的需求。与OGBN-ARXIV和OGBN产品数据集的巨型+MLP基线相比,我们的模型能够在换电环境(+0.5%)中获得稍好的精度,同时将模型培训时间最多减少40%。我们的模型也适用于电感设置,优于巨型 +MLP高达 +2.23%。
translated by 谷歌翻译